Národní úložiště šedé literatury Nalezeno 20 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Emotion Recognition from Acted and Spontaneous Speech
Atassi, Hicham ; Přibil, Jiří (oponent) ; Zahradník, Pavel (oponent) ; Smékal, Zdeněk (vedoucí práce)
Doctoral thesis deals with emotion recognition from speech signals. The thesis is divided into two main parts; the first part describes proposed approaches for emotion recognition using two different multilingual databases of acted emotional speech. The main contributions of this part are detailed analysis of a big set of acoustic features, new classification schemes for vocal emotion recognition such as “emotion coupling” and new method for mapping discrete emotions into two-dimensional space. The second part of this thesis is devoted to emotion recognition using multilingual databases of spontaneous emotional speech, which is based on telephone records obtained from real call centers. The knowledge gained from experiments with emotion recognition from acted speech was exploited to design a new approach for classifying seven emotional states. The core of the proposed approach is a complex classification architecture based on the fusion of different systems. The thesis also examines the influence of speaker’s emotional state on gender recognition performance and proposes system for automatic identification of successful phone calls in call center by means of dialogue features.
Room Impulse Response Estimation from Speech Signal
Gregor, Adam ; Szőke, Igor (oponent) ; Černocký, Jan (vedoucí práce)
When travelling in a room, any sound is distorted by a room impulse response (RIR). Determining RIR has always been an important task in acoustics, but nowadays, it is even more important, as RIR can be used to augment data for training automatic speech recognition (ASR) systems. Classically, a RIR is estimated from a pair of clean and reverberated sound signals. This is however not practical for real scenarios (such as personal assistants, smart homes, etc.), as the clean signal is not available. The aim of the bachelor thesis is to investigate ''blind'' RIR estimation only from a reverberated speech signal. We have used the BUT ReverbDB data set and first, re-implemented techniques for classical clean-reverberated signals estimation of RIRs. Then, we investigated two techniques for RIR estimation only from a reverberated signal. The first technique uses reverberated impulse-like phonemes in speech which are expected to resemble RIR. Averaging and deconvolution of these phonemes were tested to improve the quality and robustness of the estimation. The second technique makes use of a regression neural networks trained to produce the RIR from a speech input. Although none of the techniques reaches the quality of classical measurement, the estimated RIRs have the potential to help in augmenting data for ASR system training.
Jednoduchý textově nezávislý hlasový zámek - Softwarový systém pro verifikaci mluvčích
Kotulek, Milan ; Dolenský,, Jan (oponent) ; Staněk, Miroslav (vedoucí práce)
V této diplomové práci jsou představeny různé formy biometriky a následně řešena problematika verifikace osob prostřednictvím hlasu. Nejprve je provedena analýza nahrávek řeči, vyhledání samohláskových úseků, ze kterých jsou následně získány spektrální charakteristiky pro jednotlivé samohlásky a mluvčí. Výsledkem této práce je vytvořená aplikace, disponující grafickým uživatelským prostředím, pro rozpoznání konkrétních mluvčí rozhodující se na základě získaných charakteristik z vytvořené databáze mluvčích. Vytvořená aplikace byla otestována, a dosažená úspěšnost korektního rozpoznání nabývá hodnoty přibližně 54 % pro krátké testovací nahrávky, a cca 88 % pro dlouhé záznamy řeči.
Statistické zpracování řečových parametrů
Svozil, Martin ; Dolenský,, Jan (oponent) ; Staněk, Miroslav (vedoucí práce)
Diplomová práce se zabývá problematikou zpracování řečového signálu a analýzou samohlásek v závislosti na emočním stavu řečníka. Byla vytvořena aplikace programu v prostředí Matlab na zpracování řečového signálu a jeho analýzu s názvem ARePa. Program obsahuje grafické rozhraní GUI pro uživatele. Aplikace provádí kompletní analýzu řečového signálu s výpočtem všech potřebných parametrů a umožňuje následovné porovnání aktuálního záznamu s uloženými záznamy v databázi za pomocí histogramu. Program samozřejmě umožňuje i archivaci aktuálního záznamu do databáze.
Aplikace statistické analýzy řeči pacientů s Parkinsonovou nemocí
Bijota, Jan ; Mžourek, Zdeněk (oponent) ; Galáž, Zoltán (vedoucí práce)
Tato diplomová práce se zabývá zpracováním řečového signálu osob postižených Parkinsonovou nemocí za účelem vytvoření statistického vzorku řečových parametrů, pomocí něhož bude možno rozdělit zkoumané osoby na parkinsoniky a neparkinsoniky. Tento statistický vzorek je tvořen na základě detekce hypokinetické dysartrie u osob postižených Parkinsonovou nemocí. V práci je rozebíráno předzpracování řečového signálu pomocí metody ustřednění a preemfáze a jeho rozdělení na části (segmentace). Následně je popsáno parametrické vyjádření zpracovávaného vzorku pomocí fonačních parametrů, MFCC a PLP koeficientů. Dále jsou rozebírány možnosti statistické analýzy pomocí zmíněného parametrického vyjádření. V přípádě této práce statistická analýza sestává z výpočtu Pearsonova a Spearmanova korelačního koeficientu, vzájemné informace a parametrického Studentova t-testu a neparametrického Mann-Whitneyova U testu. Výsledkem práce je soubor řečových parametrů pro jednotlivé dlouhé české samohlásky, které dokáží dle provedené statistické analýzy nejlépe vyjádřit rozdíl mezi zdravým řečníkem a parkinsonikem. Tyto výsledky mohou napomoci při diagnóze osoby, u níž je podezření na Parkisonovu nemoc.
Identifikace pauz v rušeném řečovém signálu
Podloucká, Lenka ; Balík, Miroslav (oponent) ; Smékal, Zdeněk (vedoucí práce)
Tato diplomová práce se zabývá identifikací pauz v rušeném řečovém signálu. Je zde popsán charakter řečového signálu a koncepce jeho zpracování. Cílem diplomové práce bylo navrhnout metodu spolehlivého určení úseků bez řečové aktivity (pauz) jak pro řeč bez přítomnosti šumu a rušení, tak i ze směsi řeči a nežádoucího rušení. Pro identifikaci pauz bylo realizováno pět detektorů v programovém prostředí MATLAB. V časové oblasti to byl energetický detektor, ve spektrální oblasti dvoukrokový detektor využívající v prvním kroku energetické vlastnosti signálu, ve druhém výpočtu statistických veličin. V kepstrální oblasti byly realizovány tři detektory, dva s využitím integrálního algoritmu a detekce třetího byla založena na diferenciálním algoritmu. Robustnost detektorů byla testována pro různé typy rušení a jejich úrovně odstupu signálu od šumu (Signal to Noise Ratio – SNR). Pro vyhodnocení úspěšnosti detekce byly sestaveny ROC křivky, ve kterých byl měnícím se parametrem rušivý signál.
Vytvoření webové aplikace pro objektivní analýzu hypokinetické dysartrie ve frameworku Django
Čapek, Karel ; Zvončák, Vojtěch (oponent) ; Galáž, Zoltán (vedoucí práce)
Tato diplomová práce se zabývá výpočtem parametrů, ktéré by byly schopny rozlišit zdravou řeč a řeč postiženou hypokinetickou dysartrií. Byla zde nastudována hypokynetická dysatrie, což je motorická porucha řečového a hlasového ústrojí. Byly nastudovány metody zpracování řečového signálu. Dále byly nastudovány parametry, které by mohly dobře rozlišovat zdravou a nemocnou řeč. Následně byly tyto parametry naprogramovány v programovacím jazyce Python. Dalším krokem bylo vytvoření webové aplikace ve frameworku Django, která slouží pro analýzu dyzartické řeči.
Zjištění Parkinsonovy nemoci na základě analýzy řečového záznamu
Vymlátil, Petr ; Trzos, Michal (oponent) ; Lněnička, Jakub (vedoucí práce)
Tato práce se zabývá zjištěním Parkinsonovi choroby na základě analýzy řečového záznamu. V úvodních kapitolách je popsán mechanismus vzniku lidského hlasu, jeho základní vlastnosti a vliv hypokinetické dysartrie na řeč. V další kapitole jsou popsány vlastnosti řečového signálu a některé metody jeho předzpracování. Následuje popis a způsob extrakce vybraných jednotlivých příznaků potřebných pro diagnózu nemoci a stručný popis metod redukce a klasifikátorů. Praktická část práce srovnává úspěšnost klasifikace naivního bayesovského klasifikátoru v závislosti na použité redukci.
Softwarový analyzátor a dolaďovač záznamenaného vokálu
Smatana, Tomáš ; Dolenský,, Jan (oponent) ; Staněk, Miroslav (vedoucí práce)
Tato práce se zabývá rozborem metod používaných pro detekování základního kmitočtu a metod pro změnu základního kmitočtu zvukového signálu s vokálem. Je zde také rozebrána obecná teorie o hudební intonaci. Na základě tohoto rozboru jsou vybrány vhodné metody následně použité při realizaci softwaru sloužícímu k dolaďování zvukového signálu s vokálem.
Metody potlačení šumu pro rozpoznávače řeči
Moldříková, Zuzana ; Smital, Lukáš (oponent) ; Odstrčilík, Jan (vedoucí práce)
Tato diplomová práce se zabývá metodami pro potlačení šumu u rozpoznávačů řeči. V teoretické části jsou proto rozebrány základní pojmy tohoto tématu a také jednotlivé metody pro potlačení šumu. Jedná se o metody spektrálního odečítání, Wienerovy filtrace, RASTA, mapování spektrogramu či algoritmy založené na odhadu šumu. V druhé části je provedena analýza typů rušení u zadaného rozpoznávače řeči, návrh a implementace metody spektrálního odečítání pro potlačení šumu u rozpoznávače řeči. Také je provedeno rozsáhlé testování alogritmů spektrálního odečítání v porovnání s metodou Wienerovy filtrace. Vyhodnocení testování je provedeno pomocí definovaných metrik, a to úspěšnosti rozpoznání, skóre rozpoznávacího systému a poměru signál šum.

Národní úložiště šedé literatury : Nalezeno 20 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.